Interim Report thinning

Ich habe die Daten aus Edaphobase zur Datenbank hinzugefügt. Der neue Datensatz hat 2252 Probestellen, 760 mehr als der ursprüngliche Datensatz. Die vollständige Verteilung der Proben ist auf der folgenden Karte zu sehen.

Karte alle Proben

Ein Reviewer kritisierte die räumlich ungleichmäßige Verteilung der Proben und schlug spatial bzw. environmental thinning vor. Beide Ansätze haben Probleme. Spatial thinning bedeutet das so lange Proben entfernt werden, bis eine spezifizierte minimale Distanz zwischen allen Probestellen bestehet. Existierende Ansätze (z.B. der spThin Algorithmus (Aiello-Lammens et al. 2015)) sind idR. stochastisch. Es werden so lange zufällig Proben entfernt bis keine Probe mehr gegen die Aufgestellte Distanzregel verstößt. Dieser Prozess wird iteriert und die Iteration mit den meisten verbleibenden Proben wird für folgende Analysen verwandt. Während dieses Verfahren für eine gleichmäßige Verteilung der Probestellen innerhalb der beprobten Bereiche sorgt, verändert es nichts an der Tatsache das manche Bereiche (z.B. Osteuropa) nicht stark beprobt wurden. Spatial thinning verringert die Anzahl der Proben stark, und die zu geringe Anzahl an Proben ist der zweite Kritikpunkt des Revierws. Letztlich, muss räumlicher Bias nicht stark mit Umweltbias korrelieren (Cosentino and Maiorano 2021). Das Kommentar des Reviewers environmental thinning anzuwenden ist also problematisch, da der Reviewer nicht bewerten kann, ob es einen Umweltbias in unseren Daten gibt, geschweige denn wie groß dieser ist.
Hier sind zwei Beispiele von spatial thinning mit dem spThin Algorithmus und den Distanzen 50 und 100 km. Diese Schritte reduzieren die Anzahl an Probestellen auf 336 beziehungsweise 140.

Karte der Proben mit einem spatial thinning von 50 bzw. 100 km.

Sebastians Ansatz ist bereits eine geschickte Verknüpfung von spatial und environmental thinning. Innerhalb jeder EUNIS Klasse (ein Proxy für Umwelt) gibt es einen Mindestabstand zwischen Probestellen. Die Auswahl der Probestellen erfolgt dabei nicht zufällig, sondern die repräsentativste Probe wird behalten. Ich habe den Ansatz um zwei Facetten erweitert um dem Reviewer entgegen zu kommen. 1. Nicht nur EUNIS sondern auch Biogeographische Region und Holdrige Life Zone werden nun zur Approximierung der Umwelt genutzt. Habitat Typen werden nun durch die Kombination dieser drei Variablen definiert und nur innerhalb der Habitat Typen wird ein spatial thinning angewandt. 2. Ich habe die räumliche Häufung der Probestellen innerhalb jedes Habitat Typen über mehrere Distanzen mit der Häufung dieses Habitats an sich verglichen. Für alle Probestellen eines Habitat Typen habe ich, nachdem naheliegende Proben entfernt wurden, Ripley’s K Statistik berechnet. Diese gibt an ob ein Punktmuster gehäuft oder regelmäßig ist. Positive Werte geben eine höhere Häufung als bei einer räumlich vollständig zufälligen Verteilung (Poisson Point Process). Der Verlauf dieses Wertes über verschiedene minimal Distanzen ist in der folgenden Abbildung zu sehen.

Ripley’s K als Maß der Häufung von Punktmustern bei verschiedenen Mindestdistanzen zwischen Proben innerhalb der Habitattypen. Jede Teilabbildung zeigt Ergebnisse für ein Habitattyp. Die schwarze Linie zeig 0 also Äquivalenz zwischen Beobachteten und theoretischem zufälligen Punktmuster. Die rote Linie zeigt die räumliche Häufung des jeweiligen Habitattypen.

Wichtig hier ist die rote Linie. Sie zeigt die gleiche Statistik aber, für die Zentroide aller 10km Quadrate über Europa. Sie zeigt also an wie stark ein bestimmter Habitat Typ gehäuft ist. Sogar eine vollkommen gleichmäßige Beprobung aller relevanten Habitattypen wäre nicht zufällig im Raum verteilt, wenn die Habitattypen dies nicht sind.

Wenn wir nun beim thinning die kleinste Distanz wählen, bei der die räumliche Häufung der Proben kleiner ist als die des Habitattypen erhalten wir folgende Selektion an Proben.

Probestellen nach habitattypspezifischem spatio-environmental thinning.

Dieser Datensatz enthät noch immer 1203 Probestellen.

References

Aiello-Lammens, Matthew E., Robert A. Boria, Aleksandar Radosavljevic, Bruno Vilela, and Robert P. Anderson. 2015. spThin: An R Package for Spatial Thinning of Species Occurrence Records for Use in Ecological Niche Models.” Ecography 38 (5): 541–45. https://doi.org/10.1111/ecog.01132.
Cosentino, Francesca, and Luigi Maiorano. 2021. “Is Geographic Sampling Bias Representative of Environmental Space?” Ecological Informatics 64 (September): 101369. https://doi.org/10.1016/j.ecoinf.2021.101369.